GWUM : une généralisation des pages Web guidée par les usages
نویسندگان
چکیده
The usage analysis of a Web site based on the extracted sequential patterns is often limited by the low support of these patterns. That is mainly due to the great diversity of the pages and behaviors. However, it is possible to group the majority of these pages in various categories during a preprocessing. Then, using these categories, rather than the URL, will allow us to discover "generic" behaviors. This article presents a methodology for Web usage mining that uses such a generalization of the URL. This generalization is based on a categorization of the URL using the information extracted from the Web users’ accesses to these pages. Then, we present an experiment which shows how the support of the extracted sequential patterns changes according to whether the patterns are obtained with or without this generalization. MOTS-CLÉS : Fouille des usage du Web, motifs séquentiels, classification
منابع مشابه
Approche Guidée par les Structures Hiérarchiques Spatiales pour la Généralisation à la Volée dans SOLAP
RÉSUMÉ. La généralisation à la volée désigne l’utilisation de techniques de généralisation automatique en temps réel. Les données générées sont temporaires et exclusivement destinées à la visualisation et non pas au stockage ou à d’autres fins. Ceci, rend ce processus bien adapté aux contextes hautement interactifs tels que la cartographie en ligne et le SOLAP. BLG tree et GAP tree sont des str...
متن کاملClassification Conceptuelle avec Généralisation par Intervalles
Résumé. Nous nous intéressons aux méthodes de classification hiérarchique ou pyramidale, où chaque classe formée correspond à un concept, i.e. une paire (extension, intension), considérant des données décrites par des variables quantitatives à valeurs réelles ou intervalles, ordinales et/ou prenant la forme de distribution de probabilités/fréquences sur un ensemble de catégories. Les concepts s...
متن کاملAnalyse des rôles dans les communautés virtuelles : définitions et premières expérimentations sur IMDb
RESUME. Analyser les rôles dans les communautés virtuelles nous permet de mieux comprendre, voire de prédire, le comportement individuel des internautes. Bien que de nombreuses approches aient été proposées, on constate un manque de généralisation des méthodes existantes et des résultats obtenus. Dans ce papier, nous passons en revue quelques théories développées à propos des rôles sociaux et n...
متن کاملApproche guidée pour l'anonymisation de bases de données
RESUME. L’anonymisation des données personnelles requiert l’utilisation d’algorithmes complexes permettant de minimiser le risque de ré-identification tout en préservant l’utilité des données. Dans cet article, nous décrivons une approche fondée sur les modèles qui guide le propriétaire des données dans son processus d’anonymisation. Le guidage peut être informatif ou suggestif. Il permet de ch...
متن کاملInterprétation d'images basée sur une approche évolutive guidée par une ontologie
Résumé. Les approches de fouille et d’interprétation d’images consistant à considérer les pixels de façon indépendante ont montré leurs limites pour l’analyse d’images complexes. Pour résoudre ce problème, de nouvelles méthodes s’appuient sur une segmentation préalable de l’image qui consiste en une agrégation des pixels connexes afin de former des régions homogènes au sens d’un certain critère...
متن کامل